ARIMA-3 Autoregressive Models and Moving Average Models

在机器学习常用的回归模型中，我们使用预测变量(predictors)的线性组合来预测感兴趣的变量，而在自回归模型(autoregression)模型中，我们某个变量过去的取值来预测这个变量。所以这里自回归表示用自己预测自己。而与自回归模型不同，移动平均模型(moving average model)是以类似回归的形式使用过去的预测误差进行预测。

1. Autoregressive models

则自回归模型可以表示成如下形式：
$$
y_t=c+\phi_1y_{t-1}+\phi_2y_{t-2}+ \ldots + \phi_py_{t-p}+\epsilon_t
$$
这里$\epsilon_t$表示白噪声，我们把上述模型叫做一个$p$阶的自回归模型，可以表示为AR(p) model。
自回归模型可以极其灵活的处理很多种不同的时间序列模式。如下图所示展示了AR(1)模型和AR(2)模型。通过改变参数$\phi_1,\ldots,\phi_p$可以产生不同的时间序列模型，而误差项$\epsilon_t$只会影响序列的尺度，不会影响patterns。

上面两个图中，第一个AR(1)模型和第二个AR(2)模型的函数分别为：
$$
\begin{aligned}
AR(1):\quad y_t & = 18-0.8y_{t-1}+\epsilon_t \\
AR(2):\quad y_t & = 8+1.3y_{t-1}-0.7y_{t-2}+\epsilon_t
\end{aligned}
$$
对于AR(1)模型：

当$\phi_1=0$的时候，$y_t$等价于白噪声(white noise)
当$\phi_1=1 \ \land \ c=0$的时候，$y_t$相当于随机游走(random walk)
当$\phi_1=1 \ \land \ c\neq0$的时候，，$y_t$相当于带有漂移的随机游走(random walk with drift)
当$\phi_1<0$的时候，$y_t$会在均值附近震荡(oscillate)

一般来说，为了约束自回归模型为stationary数据，我们可以约束自回归模型的参数。

对于AR(1)模型：$-1<\phi_1<1$
对于AR(2)模型：$-1<\phi_2<1,\phi_1+\phi_2<1,\phi_2-\phi_1<1$

当$p\geq3$的时候，约束就会变得很复杂了。

2. Moving average models

移动平均模型的形式如下：
$$
y_t=c+\epsilon_t+\theta_1\epsilon_{t-1}+\theta_2\epsilon_{t-2}+\ldots+\theta_q\epsilon_{t-q}
$$
这里$\epsilon_t$是白噪声，我们把这个模型叫做q阶的MA(q)模型，当然我们其实无法观测到变量$\epsilon_t$的取值，所以它不算是通常意义上的回归模型。它知识认为$y_t$的值可以由过去的预测误差值的加权移动平均得到。如下图展示了两个模型MA(1)和MA(2)。

上图中的两个模型MA(1)和MA(2)分别为:
$$
\begin{aligned}
MA(1): \quad y_t &= 20+\epsilon_t+0.8\epsilon_{t-1} \\
MA(2): \quad y_t &= \epsilon_t - \epsilon_{t-1} + 0.8\epsilon_{t-2}
\end{aligned}
$$
其实任何一个stationary $\text{AR}(p)$模型都可以表示成一个$\text{MA}(\infty)$模型，我们可以推到以下AR(1)模型。
$$
\begin{aligned}
MA(1): \quad y_t &= \phi_1y_{t-1}+\epsilon_t \\
&= \phi_1(\phi_1y_{t-2}+\epsilon_{t-1})+\epsilon_t \\
&= \phi_1^2y_{t-2}+\phi_1\epsilon_{t-1}+\epsilon_t \\
&= \phi_1^3y_{t-3}+\phi_1^2\epsilon_{t-2}+\phi_1\epsilon_{t-1}+\epsilon_t \\
&= etc.
\end{aligned}
$$
如果$-1<\phi_1<1$，随着$k$变大，$\phi_1^k$的值会越变越小，最终我们得到如下公式。
$$
y_t=\epsilon_t+\phi_1\epsilon_{t-1}+\phi_1^2\epsilon_{t-2}+\phi_1^3\epsilon_{t-3}+\ldots
$$
即为一个$\text{MA}(\infty)$模型。如果里面的参数$\phi_1$和$\phi_2$有满足上面提到的约束，则这个MA模型是可逆的，它可以转化为一个AR模型，也就是我们可以将任何可逆的MA(q)模型，转化成$\text{AR}(\infty$)模型，而且我们不仅仅是为了转化，这个过此中也有一些很不错的数学性质。比如我们将一个MA(1)过程，$y_t=\epsilon_t+\theta_1\epsilon_{t-1}$转化成它的相应$\text{AR}(\infty)$模型,则有如下性质：
$$
\epsilon_t=\sum_{k=0}^\infty(-\theta)^jy_{t-j}
$$
此处未完待续…

Contents

1. Autoregressive models

2. Moving average models